平均每天有一个隐私计算专利在提交,他们是怎么做到的?
01
为了新的技术高地,赌上六年
王力是蚂蚁可信隐私计算通用框架 “隐语”的算法负责人,常常需要和行外人、亲朋好友解释这一生词。大数据时代下,我们在享受数据共享带来的个性化的服务时,也容易催生安全和隐私的问题。
“这时问题就来了。我的数据里有我的秘密,比如我今年多大,我住哪里。隐私计算是通过各种技术保护数据里的秘密,把不想被别人知道的数据锁起来,但并不会影响数据的使用和价值。”
王力回忆,在2016年刚入行时,隐私计算更多还是一个“技术人很兴奋,但实际应用场景很难寻“的状态。王力毕业于上海交通大学计算机系,有一定AI技术背景,当时蚂蚁决定孵化隐私计算项目,他没有犹豫太久,就投身进了新的项目中。
那时王力有过不少被骚扰的经历,“车险到期了,各家保险公司都会打电话给我。房产中介不知是从哪里拿到我的电话的。诈骗电话也对我的信息了如指掌。”这都是典型的个人隐私泄露场景。
彼时大数据分析风头正劲,大多公司关注的还是如何用数据盈利,如何存活下去。带有个人隐私的数据满天飞,很少人会重视数据的隐私性。在这个环境下,着手探索应用方案,是逆势而上,在给各方添堵。和合作方聊的时候也会有质疑,别家都是这么做的,怎么到你这里就那么麻烦呢?
如何平衡便利的获取数据和用户的隐私保护之间的关系,是一众隐私计算团队需要考虑的问题。
混沌之初,先不管大家怎么想,团队还是以年为单位,默默地推进着。埋头搞技术研发的同时,也在增加业务交流的频次,希望能找到实际应用中的最优解,这在效率优先的互联网环境中并不多见。看着曾经所在的AI团队,同事们各个忙碌而充实,业务也能快速落地,王力“愁”过一阵子。他用瓶颈、灰暗来形容那段时光。“我自己心里挺着急,会和原部门的同事有对比,但我的主管好像并不是很急。”
技术人员的排解方式独到的硬核,技术为王,层级靠边,就事论事,方法不限。王力和主管王磊常有业务上的摩擦,一言不合就去会议室闭门辩论,经常就是一整天,写一整墙旁人看不懂的板书。聊完了,气也平了,思路也顺了,继续干活了,团队在多次碰撞中形成了特有的协同模式,王磊也成了陪伴王力最久,一起并肩作战的好战友。
团队花了3年时间做技术研发、沉淀,调研论文、实验、设计方案,把公司过成了实验室,终于在十几条可探索路线中,确定了两条技术路线。摸着石头过河,要把每块石头都反复研究透,才知道它稳不稳,能不能踩实。在技术研究的过程中,随手记录和整理也催生多个隐私计算专利的诞生,且有逐年增加之势,先前3年的沉淀积累更能对当下的环境有系统性的认识和判断。开头吸引眼球的专利数不是他们的目标,反而是团队在技术上持续有突破的最好证明。
王力在内部分享隐私计算的工作进展
团队在随后的日子中不断壮大,也多了密码学、数学等多元背景的同学,随着研究逐渐找到突破点,这群工程师,将隐私技术与机器学习融合,和业务应用持续打磨,研发出了一套统一的可信隐私计算通用框架——隐语,这是个融合了MPC、TEE、同态等多种密态计算的虚拟设备,可让隐私计算更广泛地应用到 AI、数据分析等场景中,解决隐私保护和数据孤岛等行业痛点。
02
因为笃定,从而不急
王磊的“不着急”也来自于对行业的预判。2021下半年,随着《个人信息保护法》、《数据安全法》等一系列与数据有关的法律出台,王力看到了行业关注度的呈指数型增长。最直观的感受是,在与合作方沟通中,隐私计算的优先级被排得越来越高。
隐语也在探索医疗场景中的应用。
医保结算中,医院时常会垫付部分费用,也有因对病人病况了解程度不够,导致垫付费用过高,院方亏损的情况发生。这就要求医院对病人情况有一个较为全面的了解,但病人每次不一定在同一家医院就诊,病例数据又是敏感信息,如何安全又高效的和各家医院进行数据共享?隐私计算成了最优解。
王力忘记项目成功后是如何庆祝的,“反正很有成就感,提振了团队士气。”团队随行业成长,参与并推动了行业规范的制定。“走着走着发现同行者越来越多了,大家开始形成共识,数据脱敏、多方安全计算、硬件加密、联邦学习成为主流技术,可行路线也越来越明确。”
王力会形容和同事之间的关系是革命友谊,没有那么多花里胡哨的寒暄,方向定好了,就往前冲,在团队里占少数的女生也从不扭捏。
03
把技术创新当成生活
“可以用你的话通俗的介绍一下隐私计算吗?”
“王力你聊过的,以他说的为准。”
“你会和家人聊你的工作内容吗?”
“不聊的。”
“隐私技术的发展能让隐私泄露的现象完全消失吗?”
“这个问题好难回答。”
方文静的回答,严谨的几乎刀刀见血。这也正是隐私计算的特点:太新了,一句话根本说不清楚。
在那段不确定的日子里,她和王力的生活状态完全不同,她更笃定的认可自己在做的事,活出了另一种生活哲学。
方文静是王力在上海交通大学计算机专业的同系师妹,毕业就加入了蚂蚁,如今有5年。她爱做的事情很多:爱手工,爱运动,爱唱歌。用专利奖金买midi键盘、声卡和话筒,学写歌、学编曲,开了自己的音乐频道,出了5首歌。
本着这种不断找刺激、找乐子的生活哲学,在方文静眼里是可以拓展到工作之中的。
“你需要快速从外界汲取知识,内化为自己的知识,再去解决不同的业务问题,每一步都是成就感的来源。”她常花一整天的时间读新的论文,周末也会继续。
每一个获得专利奖金的人都会拿出部分,分到每周两次的水果会基金里。大家都有共识,专利申报除了本人的贡献,也有团队的支持。而方文静就是团队里的首席水果官CFO——Chief Fruit Officer,连续4年承包水果会。这也是属于团队的欢乐时光,大家会一起边吃边侃家常、聊技术,不论职级、年龄大小,大家以技术论长短。
她认为工作的成就感来源于挑战性,从不觉得女性身份在技术圈里会存在壁垒。她习惯把一切都形容得很轻松,“实习的时候做了一个离线算法的模拟,师兄就说把专利写一下,我说好的。”水到渠成的写了第一篇专利。
但只有她自己知道,“好的”背后意味着什么。要研究透世界范围内该技术领域的详情,吃透一篇篇英文原版论文,这都是基础。在近期的工作中,方文静在国际顶级学术会议CIKM发刊论文,并申请了相关专利。
04
技术学霸的乐趣来自“啃”论文
技术学霸们都很低调。隐私计算产品摩斯的技术团队成员,有九成以上是来自国内外知名院校的研究生、博士、博士后,自主研发专利200多项。要不是同事提醒去检索,摩斯的算法负责人李漓春也不知道自己手握100余个隐私计算相关的专利。
他曾在南洋理工大学做隐私计算研究的博士后, 2012年起深耕隐私计算。经历行业变迁十年,最享受的还是工作中“啃”论文的时光。“简单的论文可能花一、二小时就看明白了,有些困难的需要花上半天看,再想能怎么落地。”有个方案想了大半年,陆续出了六、七种思路。每次都觉得已经差不多了,然后又在某个瞬间灵感迸发,再回去对方案进行优化,打磨好了再顺手记录下来,沉淀成专利和论文。李漓春专注地描绘那段时光,沉浸在技术的世界里。
他并不是一个人在战斗,他把自己称为“学习委员”,每两个星期在算法小组内组织一次学习会,分享和讨论近期看到的前沿论文和最新的算法技术,协同作战。毕竟“每个技术你都要特别的精通,才能去明白到底每个技术的优点和缺点是什么。”
隐私计算、密码学往往需要数学知识的支持,团队成员时常能互相补充。同样高产专利的张祺智博士来自东京大学数学系,常在交流中引入新的数学工具;而来自中科院密码学专业的赵原博士则负责提高性能,并多次参与行业标准制定。不同学科、不同国家的教育背景带来的多方视角分析往往能带来新的灵感,激烈的讨论也成为研究不断深入的动力。
团队对技术的热爱、对性能和安全的极致追求,也获得了一定的回响。
在2019年、2021年国际顶尖隐私计算赛事iDASH中,李漓春带领的摩斯团队在比赛里获得了多方安全计算、同态加密、联邦学习三项冠军,提交方案的各项性能上均优于第二名数倍。摩斯团队也成为该项赛事自创办以来首支夺冠、获冠军数最多的中国队伍。
蚂蚁摩斯团队获得iDASH2021同态加密冠军
隐私计算的基础理论诞生于30多年前,但将理论应用于实践还存在较大的挑战,尤其是在性能、安全、易用性方面。“如果把隐私计算产品比作一架飞机,我们小组的目标就是研发业内领先的隐私计算算法引擎,让隐私计算产品又安全又快又易操纵,促进隐私计算的商业化应用。”
李漓春所在的“班集体”打造的产品“蚂蚁链摩斯”是国内首个大规模商用的隐私计算产品,目前已应用于10多个行业,服务于上百家机构。摩斯目前已发展出专业版、桌面版、一体机版等多种产品形态。其中,“摩斯一体机”于2021年在世界互联网大会“互联网之光”博览会上对外发布,该机器通过隐私计算、可信硬件、区块链等技术的深度整合,在金融、政务、医疗等场景下都可以提供即开即用、隐私保护的数据价值流转服务。
在后来的分享会中,李漓春还没开始紧张,就得知自己因防疫原因而没法入场。赵原临危受命,替他做了讲解。这个意外,正好佐证了团队成员之间的高度信赖——而这也是摩斯一体机得以诞生的环境。“我们是互相认同、互相信任的。”李漓春总结,而这才是“一起好好把事情搞下去”的状态。
05
定义技术的可能性
不仅仅在隐私计算领域。
在蚂蚁,技术创新是每个技术团队都在追求的。2017年以来,蚂蚁集团持有的专利数量,在不到五年的时间里增长了37倍,达15000多项。到了2021年,蚂蚁集团在全球新增6600多项授权专利。
计算下来,2021年间蚂蚁每天都增加18项目授权专利。回看这些年积累的专利数,都是一步一个留下的脚印,摸着过河的一块块石头。
很多像王力、李漓春这样的技术人才,在前沿技术领域里摸爬滚打,却并不孤单。他们沿用大学里就养成的习惯,每个人按照自己擅长的方向去做学术研究,一起讨论,协同作战。往往需要高度投入才能够琢磨清楚这一技术背后的优缺点,大家都清楚协作的力量远胜于单打独斗,这里也提供了沉下心做研究的空间。
李漓春在行业会议上进行隐私计算技术布道
当下,隐私保护被提到了国家层面的讨论高度。国内企业正加速入局隐私计算市场,金融、医疗、政务等多场景案例的应用逐步落地,数据价值变革从人类“将来之事”逐渐变成“眼前之事”,但同时,现有的单一技术不能完全解决当下的问题,规范的完善和用户意识培养也不是一蹴而就的事,但这群怀揣科技梦想的技术人,已经在多年的研究里做好了准备。解法如何,是否平衡得当,一切都还需要时间来验证。
技术创新无止境,也正因此,科技改变生活的边界感上变得非常有想象力。今天一个看不见的技术创新,或许就成为明天科技改变生活的核心爆发力。这样的探索是有价值的,这群“没有满足心”的技术人,他们可以创造隐私计算技术的千余项创新,也可以在未来的定义一道新的技术边界。他们正在创造科技生活的另一种可能性。